FILTER MODE ACTIVE

#понимание видео

Найдено записей: 2

#понимание видео20.08.2025

M3-Agent: мультимодальный агент с долгосрочной памятью и улучшенным рассуждением

'M3-Agent предлагает структуру мультимодальной долгосрочной памяти, объединяющую эпизодические и семантические представления для улучшенного рассуждения и понимания длинных видео и аудио.'

#понимание видео15.05.2025

ByteDance представляет Seed1.5-VL: прорывная модель для мульти-модального искусственного интеллекта

ByteDance представила Seed1.5-VL — мощную модель vision-language, которая достигает лучших результатов на многих бенчмарках и продвигает мульти-модальное понимание и рассуждение в ИИ.